home *** CD-ROM | disk | FTP | other *** search
/ PC World Komputer 2003 November A / PCWK1103A.iso / Adobe After Effects 6.0 tryout / MM4.Cab / F3619_THAI.TXT.942461E0_7FE8_440B_86B6_AA6592C2EC51 < prev    next >
Text File  |  2003-03-20  |  15KB  |  373 lines

  1. ##Adobe File Version: 1.000
  2. #=======================================================================
  3. #   FTP file name:  THAI.TXT
  4. #
  5. #   Contents:       Map (external version) from Mac OS Thai
  6. #                   character set to Unicode 2.1
  7. #
  8. #   Copyright:      (c) 1995-1999 by Apple Computer, Inc., all rights
  9. #                   reserved.
  10. #
  11. #   Contact:        charsets@apple.com
  12. #
  13. #   Changes:
  14. #
  15. #       b02  1999-Sep-22    Update contact e-mail address. Matches
  16. #                           internal utom<b1>, ufrm<b2>, and Text
  17. #                           Encoding Converter version 1.5.
  18. #       n07  1998-Feb-05    Update to match internal utom<n5>, ufrm<n13>
  19. #                           and Text Encoding Converter version 1.3:
  20. #                           Use standard Unicodes plus transcoding hints
  21. #                           instead of single corporate characters; see
  22. #                           details below. Also update header comments
  23. #                           to new format.
  24. #       n04  1995-Nov-17    First version (after fixing some typos).
  25. #                           Matches internal ufrm<n6>.
  26. #
  27. # Standard header:
  28. # ----------------
  29. #
  30. #   Apple, the Apple logo, and Macintosh are trademarks of Apple
  31. #   Computer, Inc., registered in the United States and other countries.
  32. #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
  33. #   throughout this document, "Macintosh" can be used to refer to
  34. #   Macintosh computers and "Unicode" can be used to refer to the
  35. #   Unicode standard.
  36. #
  37. #   Apple makes no warranty or representation, either express or
  38. #   implied, with respect to these tables, their quality, accuracy, or
  39. #   fitness for a particular purpose. In no event will Apple be liable
  40. #   for direct, indirect, special, incidental, or consequential damages 
  41. #   resulting from any defect or inaccuracy in this document or the
  42. #   accompanying tables.
  43. #
  44. #   These mapping tables and character lists are subject to change.
  45. #   The latest tables should be available from the following:
  46. #
  47. #   <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
  48. #   <ftp://dev.apple.com/devworld/Technical_Documentation/Misc._Standards/>
  49. #
  50. #   For general information about Mac OS encodings and these mapping
  51. #   tables, see the file "README.TXT".
  52. #
  53. # Format:
  54. # -------
  55. #
  56. #   Three tab-separated columns;
  57. #   '#' begins a comment which continues to the end of the line.
  58. #     Column #1 is the Mac OS Thai code (in hex as 0xNN)
  59. #     Column #2 is the corresponding Unicode or Unicode sequence
  60. #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
  61. #     Column #3 is a comment containing the Unicode name
  62. #
  63. #   The entries are in Mac OS Thai code order.
  64. #
  65. #   Some of these mappings require the use of corporate characters.
  66. #   See the file "CORPCHAR.TXT" and notes below.
  67. #
  68. #   Control character mappings are not shown in this table, following
  69. #   the conventions of the standard UTC mapping tables. However, the
  70. #   Mac OS Thai character set uses the standard control characters at
  71. #   0x00-0x1F and 0x7F.
  72. #
  73. # Notes on Mac OS Thai:
  74. # ---------------------
  75. #
  76. #   Codes 0xA1-0xDA and 0xDF-0xFB are the character set from Thai
  77. #   standard TIS 620-2533, except that the following changes are
  78. #   made:
  79. #     0xEE is TRADE MARK SIGN (instead of THAI CHARACTER YAMAKKAN)
  80. #     0xFA is REGISTERED SIGN (instead of THAI CHARACTER ANGKHANKHU)
  81. #     0xFB is COPYRIGHT SIGN (instead of THAI CHARACTER KHOMUT)
  82. #
  83. #   Codes 0x80-0x82, 0x8D-0x8E, 0x91, 0x9D-0x9E, and 0xDB-0xDE are
  84. #   various additional punctuation marks (e.g. curly quotes,
  85. #   ellipsis), no-break space, and two special characters "word join"
  86. #   and "word break".
  87. #
  88. #   Codes 0x83-0x8C, 0x8F, and 0x92-0x9C are for positional variants
  89. #   of the upper vowels, tone marks, and other signs at 0xD1,
  90. #   0xD4-0xD7, and 0xE7-0xED. The positional variants would normally
  91. #   be considered presentation forms only and not characters. In most
  92. #   cases they are not typed directly; they are selected automatically
  93. #   at display time by the WorldScript software. However, using the
  94. #   Thai-DTP keyboard, the presentation forms can in fact be typed
  95. #   directly using dead keys. Thus they must be treated as real
  96. #   characters in the Mac OS Thai encoding. They are mapped using
  97. #   variant tags; see below.
  98. #
  99. #   Several code points are undefined and unused (they cannot be
  100. #   typed using any of the Mac OS Thai keyboard layouts): 0x90, 0x9F,
  101. #   0xFC-0xFE. These are not shown in the table below.
  102. #
  103. # Unicode mapping issues and notes:
  104. # ---------------------------------
  105. #
  106. #   The goals in the Apple mappings provided here are:
  107. #   - Ensure roundtrip mapping from every character in the Mac OS Thai
  108. #   character set to Unicode and back
  109. #   - Use standard Unicode characters as much as possible, to maximize
  110. #   interchangeability of the resulting Unicode text. Whenever possible,
  111. #   avoid having content carried by private-use characters.
  112. #
  113. #   To satisfy both goals, we use private use characters to mark variants
  114. #   that are similar to a sequence of one or more standard Unicode
  115. #   characters.
  116. #
  117. #   Apple has defined a block of 32 corporate characters as "transcoding
  118. #   hints." These are used in combination with standard Unicode characters
  119. #   to force them to be treated in a special way for mapping to other
  120. #   encodings; they have no other effect. Sixteen of these transcoding
  121. #   hints are "grouping hints" - they indicate that the next 2-4 Unicode
  122. #   characters should be treated as a single entity for transcoding. The
  123. #   other sixteen transcoding hints are "variant tags" - they are like
  124. #   combining characters, and can follow a standard Unicode (or a sequence
  125. #   consisting of a base character and other combining characters) to
  126. #   cause it to be treated in a special way for transcoding. These always
  127. #   terminate a combining-character sequence.
  128. #
  129. #   The transcoding coding hints used in this mapping table are four
  130. #   variant tags in the range 0xF873-75. Since these are combined with
  131. #   standard Unicode characters, some characters in the Mac OS Thai
  132. #   character set map to a sequence of two Unicodes instead of a single
  133. #   Unicode character. For example, the Mac OS Thai character at 0x83 is a
  134. #   low-left positional variant of THAI CHARACTER MAI EK (the standard
  135. #   mapping is for the abstract character at 0xE8). So 0x83 is mapped to
  136. #   0x0E48 (THAI CHARACTER MAI EK) + 0xF875 (a variant tag).
  137. #
  138. # Details of mapping changes in each version:
  139. # -------------------------------------------
  140. #
  141. #   Changes from version n04 to version n07:
  142. #
  143. #   - Changed mappings of the positional variants to use standard
  144. #   Unicodes + transcoding hint, instead of using single corporate
  145. #   zone characters. This affected the mappings for the following:
  146. #   0x83-08C, 0x8F, 0x92-0x9C
  147. #
  148. #   - Just comment out unused code points in the table, instead
  149. #   of mapping them to U+FFFD.
  150. #
  151. ##################
  152.  
  153. 0x20    0x0020    # SPACE
  154. 0x21    0x0021    # EXCLAMATION MARK
  155. 0x22    0x0022    # QUOTATION MARK
  156. 0x23    0x0023    # NUMBER SIGN
  157. 0x24    0x0024    # DOLLAR SIGN
  158. 0x25    0x0025    # PERCENT SIGN
  159. 0x26    0x0026    # AMPERSAND
  160. 0x27    0x0027    # APOSTROPHE
  161. 0x28    0x0028    # LEFT PARENTHESIS
  162. 0x29    0x0029    # RIGHT PARENTHESIS
  163. 0x2A    0x002A    # ASTERISK
  164. 0x2B    0x002B    # PLUS SIGN
  165. 0x2C    0x002C    # COMMA
  166. 0x2D    0x002D    # HYPHEN-MINUS
  167. 0x2E    0x002E    # FULL STOP
  168. 0x2F    0x002F    # SOLIDUS
  169. 0x30    0x0030    # DIGIT ZERO
  170. 0x31    0x0031    # DIGIT ONE
  171. 0x32    0x0032    # DIGIT TWO
  172. 0x33    0x0033    # DIGIT THREE
  173. 0x34    0x0034    # DIGIT FOUR
  174. 0x35    0x0035    # DIGIT FIVE
  175. 0x36    0x0036    # DIGIT SIX
  176. 0x37    0x0037    # DIGIT SEVEN
  177. 0x38    0x0038    # DIGIT EIGHT
  178. 0x39    0x0039    # DIGIT NINE
  179. 0x3A    0x003A    # COLON
  180. 0x3B    0x003B    # SEMICOLON
  181. 0x3C    0x003C    # LESS-THAN SIGN
  182. 0x3D    0x003D    # EQUALS SIGN
  183. 0x3E    0x003E    # GREATER-THAN SIGN
  184. 0x3F    0x003F    # QUESTION MARK
  185. 0x40    0x0040    # COMMERCIAL AT
  186. 0x41    0x0041    # LATIN CAPITAL LETTER A
  187. 0x42    0x0042    # LATIN CAPITAL LETTER B
  188. 0x43    0x0043    # LATIN CAPITAL LETTER C
  189. 0x44    0x0044    # LATIN CAPITAL LETTER D
  190. 0x45    0x0045    # LATIN CAPITAL LETTER E
  191. 0x46    0x0046    # LATIN CAPITAL LETTER F
  192. 0x47    0x0047    # LATIN CAPITAL LETTER G
  193. 0x48    0x0048    # LATIN CAPITAL LETTER H
  194. 0x49    0x0049    # LATIN CAPITAL LETTER I
  195. 0x4A    0x004A    # LATIN CAPITAL LETTER J
  196. 0x4B    0x004B    # LATIN CAPITAL LETTER K
  197. 0x4C    0x004C    # LATIN CAPITAL LETTER L
  198. 0x4D    0x004D    # LATIN CAPITAL LETTER M
  199. 0x4E    0x004E    # LATIN CAPITAL LETTER N
  200. 0x4F    0x004F    # LATIN CAPITAL LETTER O
  201. 0x50    0x0050    # LATIN CAPITAL LETTER P
  202. 0x51    0x0051    # LATIN CAPITAL LETTER Q
  203. 0x52    0x0052    # LATIN CAPITAL LETTER R
  204. 0x53    0x0053    # LATIN CAPITAL LETTER S
  205. 0x54    0x0054    # LATIN CAPITAL LETTER T
  206. 0x55    0x0055    # LATIN CAPITAL LETTER U
  207. 0x56    0x0056    # LATIN CAPITAL LETTER V
  208. 0x57    0x0057    # LATIN CAPITAL LETTER W
  209. 0x58    0x0058    # LATIN CAPITAL LETTER X
  210. 0x59    0x0059    # LATIN CAPITAL LETTER Y
  211. 0x5A    0x005A    # LATIN CAPITAL LETTER Z
  212. 0x5B    0x005B    # LEFT SQUARE BRACKET
  213. 0x5C    0x005C    # REVERSE SOLIDUS
  214. 0x5D    0x005D    # RIGHT SQUARE BRACKET
  215. 0x5E    0x005E    # CIRCUMFLEX ACCENT
  216. 0x5F    0x005F    # LOW LINE
  217. 0x60    0x0060    # GRAVE ACCENT
  218. 0x61    0x0061    # LATIN SMALL LETTER A
  219. 0x62    0x0062    # LATIN SMALL LETTER B
  220. 0x63    0x0063    # LATIN SMALL LETTER C
  221. 0x64    0x0064    # LATIN SMALL LETTER D
  222. 0x65    0x0065    # LATIN SMALL LETTER E
  223. 0x66    0x0066    # LATIN SMALL LETTER F
  224. 0x67    0x0067    # LATIN SMALL LETTER G
  225. 0x68    0x0068    # LATIN SMALL LETTER H
  226. 0x69    0x0069    # LATIN SMALL LETTER I
  227. 0x6A    0x006A    # LATIN SMALL LETTER J
  228. 0x6B    0x006B    # LATIN SMALL LETTER K
  229. 0x6C    0x006C    # LATIN SMALL LETTER L
  230. 0x6D    0x006D    # LATIN SMALL LETTER M
  231. 0x6E    0x006E    # LATIN SMALL LETTER N
  232. 0x6F    0x006F    # LATIN SMALL LETTER O
  233. 0x70    0x0070    # LATIN SMALL LETTER P
  234. 0x71    0x0071    # LATIN SMALL LETTER Q
  235. 0x72    0x0072    # LATIN SMALL LETTER R
  236. 0x73    0x0073    # LATIN SMALL LETTER S
  237. 0x74    0x0074    # LATIN SMALL LETTER T
  238. 0x75    0x0075    # LATIN SMALL LETTER U
  239. 0x76    0x0076    # LATIN SMALL LETTER V
  240. 0x77    0x0077    # LATIN SMALL LETTER W
  241. 0x78    0x0078    # LATIN SMALL LETTER X
  242. 0x79    0x0079    # LATIN SMALL LETTER Y
  243. 0x7A    0x007A    # LATIN SMALL LETTER Z
  244. 0x7B    0x007B    # LEFT CURLY BRACKET
  245. 0x7C    0x007C    # VERTICAL LINE
  246. 0x7D    0x007D    # RIGHT CURLY BRACKET
  247. 0x7E    0x007E    # TILDE
  248. #
  249. 0x80    0x00AB    # LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
  250. 0x81    0x00BB    # RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
  251. 0x82    0x2026    # HORIZONTAL ELLIPSIS
  252. 0x83    0x0E48+0xF875    # THAI CHARACTER MAI EK, low left position
  253. 0x84    0x0E49+0xF875    # THAI CHARACTER MAI THO, low left position
  254. 0x85    0x0E4A+0xF875    # THAI CHARACTER MAI TRI, low left position
  255. 0x86    0x0E4B+0xF875    # THAI CHARACTER MAI CHATTAWA, low left position
  256. 0x87    0x0E4C+0xF875    # THAI CHARACTER THANTHAKHAT, low left position
  257. 0x88    0x0E48+0xF873    # THAI CHARACTER MAI EK, low position
  258. 0x89    0x0E49+0xF873    # THAI CHARACTER MAI THO, low position
  259. 0x8A    0x0E4A+0xF873    # THAI CHARACTER MAI TRI, low position
  260. 0x8B    0x0E4B+0xF873    # THAI CHARACTER MAI CHATTAWA, low position
  261. 0x8C    0x0E4C+0xF873    # THAI CHARACTER THANTHAKHAT, low position
  262. 0x8D    0x201C    # LEFT DOUBLE QUOTATION MARK
  263. 0x8E    0x201D    # RIGHT DOUBLE QUOTATION MARK
  264. 0x8F    0x0E4D+0xF874    # THAI CHARACTER NIKHAHIT, left position
  265. #
  266. 0x91    0x2022    # BULLET
  267. 0x92    0x0E31+0xF874    # THAI CHARACTER MAI HAN-AKAT, left position
  268. 0x93    0x0E47+0xF874    # THAI CHARACTER MAITAIKHU, left position
  269. 0x94    0x0E34+0xF874    # THAI CHARACTER SARA I, left position    
  270. 0x95    0x0E35+0xF874    # THAI CHARACTER SARA II, left position
  271. 0x96    0x0E36+0xF874    # THAI CHARACTER SARA UE, left position
  272. 0x97    0x0E37+0xF874    # THAI CHARACTER SARA UEE, left position
  273. 0x98    0x0E48+0xF874    # THAI CHARACTER MAI EK, left position
  274. 0x99    0x0E49+0xF874    # THAI CHARACTER MAI THO, left position
  275. 0x9A    0x0E4A+0xF874    # THAI CHARACTER MAI TRI, left position
  276. 0x9B    0x0E4B+0xF874    # THAI CHARACTER MAI CHATTAWA, left position
  277. 0x9C    0x0E4C+0xF874    # THAI CHARACTER THANTHAKHAT, left position
  278. 0x9D    0x2018    # LEFT SINGLE QUOTATION MARK
  279. 0x9E    0x2019    # RIGHT SINGLE QUOTATION MARK
  280. #
  281. 0xA0    0x00A0    # NO-BREAK SPACE
  282. 0xA1    0x0E01    # THAI CHARACTER KO KAI
  283. 0xA2    0x0E02    # THAI CHARACTER KHO KHAI
  284. 0xA3    0x0E03    # THAI CHARACTER KHO KHUAT
  285. 0xA4    0x0E04    # THAI CHARACTER KHO KHWAI
  286. 0xA5    0x0E05    # THAI CHARACTER KHO KHON
  287. 0xA6    0x0E06    # THAI CHARACTER KHO RAKHANG
  288. 0xA7    0x0E07    # THAI CHARACTER NGO NGU
  289. 0xA8    0x0E08    # THAI CHARACTER CHO CHAN
  290. 0xA9    0x0E09    # THAI CHARACTER CHO CHING
  291. 0xAA    0x0E0A    # THAI CHARACTER CHO CHANG
  292. 0xAB    0x0E0B    # THAI CHARACTER SO SO
  293. 0xAC    0x0E0C    # THAI CHARACTER CHO CHOE
  294. 0xAD    0x0E0D    # THAI CHARACTER YO YING
  295. 0xAE    0x0E0E    # THAI CHARACTER DO CHADA
  296. 0xAF    0x0E0F    # THAI CHARACTER TO PATAK
  297. 0xB0    0x0E10    # THAI CHARACTER THO THAN
  298. 0xB1    0x0E11    # THAI CHARACTER THO NANGMONTHO
  299. 0xB2    0x0E12    # THAI CHARACTER THO PHUTHAO
  300. 0xB3    0x0E13    # THAI CHARACTER NO NEN
  301. 0xB4    0x0E14    # THAI CHARACTER DO DEK
  302. 0xB5    0x0E15    # THAI CHARACTER TO TAO
  303. 0xB6    0x0E16    # THAI CHARACTER THO THUNG
  304. 0xB7    0x0E17    # THAI CHARACTER THO THAHAN
  305. 0xB8    0x0E18    # THAI CHARACTER THO THONG
  306. 0xB9    0x0E19    # THAI CHARACTER NO NU
  307. 0xBA    0x0E1A    # THAI CHARACTER BO BAIMAI
  308. 0xBB    0x0E1B    # THAI CHARACTER PO PLA
  309. 0xBC    0x0E1C    # THAI CHARACTER PHO PHUNG
  310. 0xBD    0x0E1D    # THAI CHARACTER FO FA
  311. 0xBE    0x0E1E    # THAI CHARACTER PHO PHAN
  312. 0xBF    0x0E1F    # THAI CHARACTER FO FAN
  313. 0xC0    0x0E20    # THAI CHARACTER PHO SAMPHAO
  314. 0xC1    0x0E21    # THAI CHARACTER MO MA
  315. 0xC2    0x0E22    # THAI CHARACTER YO YAK
  316. 0xC3    0x0E23    # THAI CHARACTER RO RUA
  317. 0xC4    0x0E24    # THAI CHARACTER RU
  318. 0xC5    0x0E25    # THAI CHARACTER LO LING
  319. 0xC6    0x0E26    # THAI CHARACTER LU
  320. 0xC7    0x0E27    # THAI CHARACTER WO WAEN
  321. 0xC8    0x0E28    # THAI CHARACTER SO SALA
  322. 0xC9    0x0E29    # THAI CHARACTER SO RUSI
  323. 0xCA    0x0E2A    # THAI CHARACTER SO SUA
  324. 0xCB    0x0E2B    # THAI CHARACTER HO HIP
  325. 0xCC    0x0E2C    # THAI CHARACTER LO CHULA
  326. 0xCD    0x0E2D    # THAI CHARACTER O ANG
  327. 0xCE    0x0E2E    # THAI CHARACTER HO NOKHUK
  328. 0xCF    0x0E2F    # THAI CHARACTER PAIYANNOI
  329. 0xD0    0x0E30    # THAI CHARACTER SARA A
  330. 0xD1    0x0E31    # THAI CHARACTER MAI HAN-AKAT
  331. 0xD2    0x0E32    # THAI CHARACTER SARA AA
  332. 0xD3    0x0E33    # THAI CHARACTER SARA AM
  333. 0xD4    0x0E34    # THAI CHARACTER SARA I
  334. 0xD5    0x0E35    # THAI CHARACTER SARA II
  335. 0xD6    0x0E36    # THAI CHARACTER SARA UE
  336. 0xD7    0x0E37    # THAI CHARACTER SARA UEE
  337. 0xD8    0x0E38    # THAI CHARACTER SARA U
  338. 0xD9    0x0E39    # THAI CHARACTER SARA UU
  339. 0xDA    0x0E3A    # THAI CHARACTER PHINTHU
  340. 0xDB    0xFEFF    # ZERO WIDTH NO-BREAK SPACE
  341. 0xDC    0x200B    # ZERO WIDTH SPACE
  342. 0xDD    0x2013    # EN DASH
  343. 0xDE    0x2014    # EM DASH
  344. 0xDF    0x0E3F    # THAI CURRENCY SYMBOL BAHT
  345. 0xE0    0x0E40    # THAI CHARACTER SARA E
  346. 0xE1    0x0E41    # THAI CHARACTER SARA AE
  347. 0xE2    0x0E42    # THAI CHARACTER SARA O
  348. 0xE3    0x0E43    # THAI CHARACTER SARA AI MAIMUAN
  349. 0xE4    0x0E44    # THAI CHARACTER SARA AI MAIMALAI
  350. 0xE5    0x0E45    # THAI CHARACTER LAKKHANGYAO
  351. 0xE6    0x0E46    # THAI CHARACTER MAIYAMOK
  352. 0xE7    0x0E47    # THAI CHARACTER MAITAIKHU
  353. 0xE8    0x0E48    # THAI CHARACTER MAI EK
  354. 0xE9    0x0E49    # THAI CHARACTER MAI THO
  355. 0xEA    0x0E4A    # THAI CHARACTER MAI TRI
  356. 0xEB    0x0E4B    # THAI CHARACTER MAI CHATTAWA
  357. 0xEC    0x0E4C    # THAI CHARACTER THANTHAKHAT
  358. 0xED    0x0E4D    # THAI CHARACTER NIKHAHIT
  359. 0xEE    0x2122    # TRADE MARK SIGN
  360. 0xEF    0x0E4F    # THAI CHARACTER FONGMAN
  361. 0xF0    0x0E50    # THAI DIGIT ZERO
  362. 0xF1    0x0E51    # THAI DIGIT ONE
  363. 0xF2    0x0E52    # THAI DIGIT TWO
  364. 0xF3    0x0E53    # THAI DIGIT THREE
  365. 0xF4    0x0E54    # THAI DIGIT FOUR
  366. 0xF5    0x0E55    # THAI DIGIT FIVE
  367. 0xF6    0x0E56    # THAI DIGIT SIX
  368. 0xF7    0x0E57    # THAI DIGIT SEVEN
  369. 0xF8    0x0E58    # THAI DIGIT EIGHT
  370. 0xF9    0x0E59    # THAI DIGIT NINE
  371. 0xFA    0x00AE    # REGISTERED SIGN
  372. 0xFB    0x00A9    # COPYRIGHT SIGN
  373.